課程資訊
課程名稱
數位語音處理
DIGITAL SPEECH PROCESSING 
開課學期
96-2 
授課對象
電機資訊學院  電信工程學研究所  
授課教師
李琳山 
課號
EE5026 
課程識別碼
921 U1120 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期二2,3,4(9:10~12:10) 
上課地點
電二229 
備註
限學士班三年級以上
總人數上限:130人 
 
課程簡介影片
 
核心能力關聯
本課程尚未建立核心能力關連
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

This is a first course on computer processing of speech signals for undergraduate students in electrical engineering and computer science. Both theoretical issues and practical problems will be discussed, and both fundamental concepts and research topics will be emphasized. The viewpoints will be centralized on the vision of spoken language processing under-network environment.
Part I: Fundamental Topics
1.Introduction 5.Acoustic Modeling
2.Basic Concepts in Speech Recognition 6.Language Modeling
3.Research Roadmap in this Area 7.Speech Signals and Front-end Processing
4.More about Hidden Markov Models (HMM) 8.Linguistic Decoding and Search Algorithm
Part II: Research Topics
1.Speaker Variabilities: Adaptation and Recognition
2.Latent Semantic Analysis for Linguistic Processing
3.Voice-based Information Retrieval
4.Robustness for Acoustic Environment
5.Spoken Document Understanding and Organization
6.Some Fundamental Problem-solving Approaches
7.Keyword Spotting and Utterance Verification
8.Spoken Dialogues
9. Distributed Speech Recognition and Wireless Environment
 

課程目標
1.本課程所需要的最主要基礎能力是數學模型(機率、線性代數)及軟體程式,前半強調基礎背景知識,後半則著重研究課題,讓修課同學體會由基礎走入研究的歷程。內容深度適合電機系或資工系大三或大四同學選修。
2.無線網路環境下日新月異並具多元功能的手機、PDA及各種新型的隨身手持電子設備已開拓了全新的硬體世界,也使網路的終端設備徹底多元化。在輕薄短小的硬體及豐富的應用環境下,由於人的手指不會縮小,原有的鍵盤、滑鼠等個人電腦上網介面將不再方便,語音很顯然成為最方便自然的網路介面之一。另一方面,由於多媒體技術一日千里,具備影音、視訊等多媒體功能的手持電子設備大量出現,而網路上的數位內容更多以多媒體形式呈現,它們未必具有文字檔案,卻都帶著語音訊息;它們不易瀏覽,但所帶的語音訊息最適合拿來分析重組建構成易於瀏覽的結構化數位內容。於是使用者必然會透過手持設備用語音指令上網,而網路上的數位內容也多以多媒體及語音形式呈現,適於藉其語音訊息來搜尋。今日上網動作中的文字角色將會有相當部分由語音取代,語音訊號處理技術也就自然成為新一代軟硬體技術的關鍵部份。
 
課程要求
1.Midterm Exam 25%
2.Homework Problems 35%
3.Final Exam 10%
4.Term Project 30% 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
 
參考書目
1. X. Huang, A. Acero, H. Hon, “Spoken Language Processing”, Prentice Hall, 2001,松瑞
2. F. Jelinek, “Statistical Methods for Speech Recognition”, MIT Press, 1999
3. L. Rabiner, B.H. Juang, “Fundamentals of Speech Recognition”, Prentice Hall, 1993, 民全
4. C. Becchetti, L. Prina Ricotti, “Speech Recognition- Theory and C++ implementation”, Johy Wiley and Sons, 1999, 民全
 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題